Các mô hình AI hiện tại vẫn chưa thể tư duy ở mức độ trí tuệ nhân tạo tổng quát (AGI) giống con người, theo nghiên cứu mới nhất của Apple.
Cuộc đua phát triển AGI vẫn còn một chặng đường dài phía trước. Các nhà nghiên cứu của Apple nhận thấy rằng các mô hình AI hàng đầu vẫn gặp khó khăn trong việc suy luận.
Trong một bài báo tháng 6 có tựa đề “The Illusion of Thinking” (https://machinelearning.apple.com/research/illusion-of-thinking), các nhà nghiên cứu Apple chỉ ra rằng những đánh giá hiện tại chủ yếu tập trung vào các chuẩn mực toán học và mã hóa đã được thiết lập, “nhấn mạnh vào độ chính xác của câu trả lời cuối cùng”. Tuy nhiên, điều này không cung cấp thông tin chi tiết về khả năng suy luận của các mô hình AI.
Các nhà nghiên cứu đã thiết kế các trò chơi giải đố khác nhau để kiểm tra các biến thể “tư duy” và “phi tư duy” của các chatbot như Claude Sonnet, OpenAI’s o3-mini và o1, DeepSeek-R1 và V3.
Họ phát hiện ra rằng “LRM (Large Reasoning Models) gặp phải sự sụp đổ hoàn toàn về độ chính xác vượt quá độ phức tạp nhất định”, không khái quát hóa được suy luận một cách hiệu quả và lợi thế của chúng biến mất khi độ phức tạp tăng lên, trái với kỳ vọng về khả năng AGI.
“Chúng tôi nhận thấy rằng LRM có những hạn chế trong tính toán chính xác: chúng không sử dụng các thuật toán rõ ràng và suy luận không nhất quán giữa các câu đố.”
Xác minh câu trả lời cuối cùng và dấu vết suy luận trung gian (biểu đồ trên cùng) và biểu đồ cho thấy các mô hình phi tư duy chính xác hơn ở độ phức tạp thấp (biểu đồ dưới cùng). Nguồn: Apple Machine Learning Research (https://ml-site.cdn-apple.com/papers/the-illusion-of-thinking.pdf)
Các nhà nghiên cứu nhận thấy suy luận không nhất quán và hời hợt với các mô hình và cũng quan sát thấy tình trạng suy nghĩ quá mức, với việc chatbot AI tạo ra câu trả lời đúng sớm và sau đó đi vào suy luận không chính xác.
Các nhà nghiên cứu kết luận rằng LRM bắt chước các mẫu suy luận mà không thực sự nội tâm hóa hoặc khái quát hóa chúng, điều này không đạt đến mức suy luận AGI.
“Những hiểu biết này thách thức các giả định hiện hành về khả năng LRM và cho thấy rằng các phương pháp tiếp cận hiện tại có thể gặp phải các rào cản cơ bản đối với suy luận tổng quát.”
Minh họa về bốn môi trường giải đố. Nguồn: Apple
AGI là chén thánh của sự phát triển AI, một trạng thái mà máy có thể suy nghĩ và lý luận như con người và ngang bằng với trí thông minh của con người.